Structuration sémantique des documents XML : Expérimentations et évaluation
نویسندگان
چکیده
RÉSUMÉ. La norme XML permet la représentation d¶XQ document selon un découpage logique qui ne reflète généralement pas la sémantique de son contenu. Il serait donc intéressant de compléter la structure logique des documents XML par une structure VpPDQWLTXH /¶REMHW GH FHW DUWLFOH HVW DORUV G¶pYDOXHU O¶DSSURFKH G¶H[WUDFWLRQ GH VWUXFWXUHV sémantiques pour les documents XML que nous effectuons sur un échantillon de documents issus de la collection ImageClef 2010 tout en utilisant le thésaurus MeSH (Medical Subject Headings).
منابع مشابه
Une approche pour lextraction automatique de structures sémantiques de documents XML
RÉSUMÉ. La nature des sources d’informations et les possibilités de description des documents disponibles via ces sources sont en constante évolution. Cette évolution, et l’enrichissement des informations qui en découle, est accélérée par l’expansion du Web, et la mise à disposition de documents de type XML. Or la structure logique de ces documents XML, au travers de balises du genre Contenu, S...
متن کاملF-CheX : Une approche de fouille dans les documents XML
Résumé. Nous présentons dans cet article une approche de fouille dans les documents XML qui prend en compte la structure et le contenu. Notre approche consiste à effectuer un clustering sur les documents XML. Ces derniers sont représentés par des ensembles de chemins conservant la structure arborescente des éléments. Les ensembles de chemins sont mappés dans une matrice sur laquelle une méthode...
متن کاملVers une annotation sémantique des images web fondée sur des patrons RDF
RÉSUMÉ. Le but de cet article est de proposer une nouvelle méthode d’annotation sémantique d’images en RDF utilisant les facteurs contextuels de l’image. L’idée de base consiste tout d’abord à préparer différents patrons d’annotation RDF en utilisant une collection et une ontologie de domaine, puis à projeter les documents de collection sur ces patrons vides afin de les instancier, et enfin à u...
متن کاملModèle unifié pour la recherche d'information sémantique
Résumé : Un modèle documentaire permet de définir les unités d’indexation (mots, termes, etc.) et de les relier aux documents dans lesquels elles apparaissent. Il permet également de définir les liens entre documents ou portions de documents (ex. citation). Les modèles documentaires sont généralement exploités en recherche d’information pour la représentation des documents et des requêtes et il...
متن کاملTraiter les documents XML avec les « contextes de lecture »
RÉSUMÉ. Le langage XML autorise, par sa souplesse de structuration, des manipulations du contenu qui créent parfois des ruptures arbitraires dans le flot naturel du texte. Ces caractéristiques soulèvent des difficultés lorsque l’on souhaite mettre en œuvre des techniques d’analyse automatique du contenu des documents XML. Cet article présente cette problématique et y répond, sur le plan théoriq...
متن کامل